Nguyên lý Hợp lý cực đại

Từ quan điểm thống kê, một tập hợp cho trước các quan sát là một mẫu ngẫu nhiên từ một quần thể nào đấy. Mục đích của xấp xỉ hợp lý cực đại là tìm ra một suy luật về quần thể đó mà có thể nhất sinh ra mẫu đấy, đặc biệt là phân phối xác suất chung của các biến ngẫu nhiên { y 1 , y 2 , … } {\displaystyle \left\{y_{1},y_{2},\ldots \right\}} , không nhất thiết độc lập và có cùng phân phối.

Ta cho ứng với mỗi phân phối xác suất một vector duy nhất θ = [ θ 1 , θ 2 , . . . , θ k ] T {\displaystyle \theta =[\theta _{1},\theta _{2},...,\theta _{k}]^{T}} các tham số mà đánh số phân phối xác suất với một được tham số hóa { f ( . ; θ ) ∣ θ ∈ Θ } {\displaystyle \{f(.;\theta )\mid \theta \in \Theta \}}

Phương pháp MLE được xây dựng dựa trên likelihood function, L ( θ ; x ) {\textstyle {\mathcal {L}}(\theta \,;x)} . Ta được cho trước một mô hình xác suất, nói cách khác là một họ các phân phối { f ( ⋅ ; θ ) ∣ θ ∈ Θ } {\textstyle \{f(\cdot \,;\theta )\mid \theta \in \Theta \}} , với θ {\textstyle \theta } là tham số (có thể ở dạng dữ liệu nhiều chiều) cho mô hình. MLE tìm kiếm giá trị của θ {\textstyle \theta } để L ( θ ; x ) {\textstyle {\mathcal {L}}(\theta \,;x)} đạt cực đại. Như đã nói ở trên, có thể hình dung là MLE đi tìm cách giải thích hợp lý cho các dữ liệu quan sát được.

Từ phương pháp này ta có định nghĩa về ước lượng hợp lý cực đại (Maximum Likelihood Estimates) như sau:

θ ^ ∈ { a r g m a x θ ∈ Θ   L ( θ ; x ) } , {\displaystyle {\hat {\theta }}\in \{{\underset {\theta \in \Theta }{\operatorname {arg\,max} }}\ {\mathcal {L}}(\theta \,;x)\},}

nếu giá trị lớn nhất đó có tồn tại.

Thường thì dùng logarit tự nhiên của likelihood function (còn gọi là log-likelihood) làm hàm mục tiêu sẽ thuận tiện hơn:

ℓ ( θ ; x ) = ln ⁡ L ( θ ; x ) . {\displaystyle \ell (\theta \,;x)=\ln {\mathcal {L}}(\theta \,;x).}

Ta cũng có thể dùng hàm log-likelihood trung bình:

ℓ ^ ( θ ; x ) = 1 n ln ⁡ L ( θ ; x ) . {\displaystyle {\hat {\ell }}(\theta \,;x)={\frac {1}{n}}\ln {\mathcal {L(\theta \,;x)}}.}

Dấu mũ nằm trên ℓ {\displaystyle \ell } là kí hiệu cho estimator. Thật vậy, ℓ ^ {\displaystyle {\hat {\ell }}} xấp xỉ log-likelihood kỳ vọng của một quan sát duy nhất trong mô hình.

Lưu ý rằng, dù dùng hàm mục tiêu là likelihood function hay log-likelihood, kết quả cũng như nhau, vì log là hàm tăng ngặt.

Liên quan